花费 26 ms
利用python数据分析panda学习笔记之Series

1 Series   a:类似一维数组的对象,每一个数据与之相关的数据标签组成   b:生成的左边为索引,不指定则默认从0开始。 c:可以通过values和ind ...

Sun Aug 20 10:39:00 CST 2017 0 4309
python数据分析4之自动采集数据

1 数据采集的重要性 数据采集是数据挖掘的基础,没有数据,挖掘也没有意义。很多时候,我们拥有多少数据源,多少数据量,以及数据质量如何,将决定我们挖掘产出的成果会怎样 2 四类采集方式 3 如 ...

Sat Dec 07 21:34:00 CST 2019 0 601
5 pyspark学习---Broadcast&Accumulator&sparkConf

1 对于并行处理,Apache Spark使用共享变量。当驱动程序将任务发送给集群上的执行者时,集群中的每个节点上都有一个共享变量的副本,这样就可以用于执行任务了。 2 两种支持得类型 (1)Br ...

Tue Apr 03 18:45:00 CST 2018 0 1917
4 pyspark学习---RDD

开始新的东西,其实很多操作在第二篇的时候就有所介绍啦。在这里继续学习一遍加深一下印象。 1关于RDD (1) RDD-----Resilient Distributed Dataset,弹性分布式 ...

Tue Apr 03 18:10:00 CST 2018 0 1197

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM